Speech synthesis unit
专利摘要:
公开号:WO1981002489A1 申请号:PCT/JP1981/000031 申请日:1981-02-17 公开日:1981-09-03 发明作者:K Umemura;H Sato;K Nakata;T Sampei;K Indo;K Murakami 申请人:Nippon Telegraph & Telephone;Hitachi Ltd;K Umemura;H Sato;K Nakata;T Sampei;K Indo;K Murakami; IPC主号:G10L19-00
专利说明:
[0001] 明 細 書 . [0002] 音 声 合 成 装 置 [0003] 技 術 分 野 [0004] 本発明は音声合成装置に関するもので、 詳し くは音声 [0005] 信号の周波数スぺク ト ル包絡をあらわすパラメ ー タ信号 [0006] と, 音声信号の周期をあらわす情報に基ずいて音声を合 [0007] 成する音声合成装置に関するものである。 [0008] 背 景 技 術 [0009] 祙式市場の市況、, 天気予報、, 各種展示会の案内等の情 [0010] 報を音声で提供する情報サー ビス通信網においては、 各 [0011] 種の情報をデジタル信号で伝送し、 これ等通信網の端末 [0012] につながれる端末機において伝送された情報を音声に変' 換して提供できるよ うに音声合成装置を使用することが [0013] 望まれている。 また学習器, 自動販売機 , 会場案内のた [0014] めの案内放送装置等発声する音声の単語の数が少ないも [0015] 'のにおいては、 従来の磁気記録テ―ブに代えて半導体メ [0016] モ リ一を使用する音声合成装置が使用されつつある。 [0017] 音声信号をデジタル信号に変換して記憶させ、 記憶さ [0018] れたデジタル信号を組合せて音声を合成するデジタ ル音 [0019] 声合成装置は、 連続する音声信号を一定時間間隔 とに [0020] 切り出し、 切り出した音声波形からこの ½声の特徵パラ [0021] メ ータを抽出し、 これをデジタル信号に変換して記憶さ [0022] せ、 音声を合成する場合には記億された音声の特徵パラ [0023] メ ータを組合せて合成するものであって、 合成音の音声 [0024] 単位を単語以下の単音節にすることができるので記憶装 [0025] .: I [0026] -vi--o 置の記憶容量を増加させることなく多くの語を合成する ことができる。 また機械的に可動する部分を持たないた め摩耗等による故障が発生せず、 維持管理が容易になる。 [0027] 従つて音声合成装置としては音声の特徵パラメ 一タに 基ずいて音声を合成する方法を使用することが維持管理 、を容易にし、 記憶装置を小容量にすることができるので 好ましい。 [0028] 音声のスぺク ト ル分布の変化は人間の舌や唇などの調 音器管の運動に基ずく ものであるため、 その変化は緩や かであり、 10〜 5 τ^ の短時間区間に着目するとほぼ定 常的と見なすことができる。 そこでこの定常区間から音 声のスぺク トルの特徵を正確に抽出することによ り音声 の分析することができ、 また抽出した情報に基ずいて音 声を合成することができる。 音'声を分析し合成する場合、 音声のスぺク トル分布の変化が定常的と見なすことがで -き る短時間区間の音声スぺク トルカ ら、 このスぺク トル の包絡を表わすパ ラ メ ータ と-, 音声信号の提幅を表わす パラメ ータ , 声帯の基本振動周波数に相当するピッチ情 報及び有声音か無声音かを判別する判別情報を抽出すれ ばよい。 、 [0029] 音声信号から上述の特徵パ ラ メ ータを抽出し、 これに 基ずいて音声を合成する音声分析合成方式の 1 つとして、 線形予測係数の一種である偏自己相関係数(: Partial AIL to -Corre ation Coefザ icients 後 P A R C 0 R 数と称す) を用いる 型の分析合成方法がある。 この装置は音声信号の特徵パラメ ータ を 係 [0030] 数で表わすもので、 音声信号の周波数スぺク ト ルの変化 [0031] が緩やかで定常的と見られる短時間区間の音声信号を例 [0032] えば ^の標本化周期で標本化し、 時系列に表われる.: [0033] 標本値のう ち接近する 2時点の標本値をこの 2時点の間 [0034] に存在する標本値を用いて最小 2乗予測し、 予測した値 [0035] と実際の 2時点の標本値とをそれぞれ比較してその差を [0036] 求め、 それぞれの差の値の相関( P C O Ji係数 ) を求 [0037] めるものである。 そして音声合成装置では白色雑音及び [0038] パルスを発生する信号発生器を音源となし、 この音源の [0039] 出力信号の振幅を前述の C O A係数で制御して出力 [0040] 信号に相関を与え、 周波数スぺク ト ル包絡を再現して音 [0041] 声を合成するものである。 [0042] この 型の音声分析合成方法は、 音声を分析 [0043] して得られる P i C O 係数, ピッチ情報 , 振幅情報及 [0044] -び有声, 無声の判別情報を全て 2進数で表わすデジタル [0045] 信号で取扱う ことができ、 これ等の情報は半導体メ モリ —に記憶させることができる。 また 2進数で表わされた [0046] 情報を電話回線を利用して伝送することもできる。 [0047] 音声を分析して音声の特徵パラメ ータを抽出する場合、 上述のよ うに音声を短時間間隔に区切つ' ' 分析を行な う。 [0048] この短時間区間は一般に分析フ レ ームあるいは単にフ レ ーム と呼ばれ、 この 1 フ レームから C 0 _R係数, ピ [0049] ツチ情報 , 振幅情報及び有声無声の判別情報が抽出され [0050] る。 そして 1 フ レーム当 りの情報は例えば 96ビッ 卜の情 [0051] G, r. l 報量で転送される。 この情報量は 1 フ レームの時間を 20 ms ec とすると 4 δΟΟビッ ト 秒の情報量となり、 1 フ レ [0052] 一ムの時間を 10TOj ec とすると 9000 ビッ ト Z秒の情報量 [0053] となる。 [0054] 音声を分析して得た音声パラメ ータに基ずいて音声を [0055] 合成する音声合成装置は、 合成する際に用いられる情報 [0056] 量によって合成音声の質が決定される。 例えば音声分析 [0057] によつ て得られた音声パラメ ータを 4800 ビッ ト /秒の情 [0058] 報量で伝送する場合と、 9000 ビッ ト Z秒の情報量で伝送 [0059] する場合とでは、 明らかに 90D0 ビッ ト Z秒の情報量で伝 [0060] 送する方が音質は良い。 しかし、 たとえばディ ジタル電 [0061] 話などでは、 回線が比敦的空いている場合は音質の良い [0062] 9600 ビッ ト Z秒でも、 回線が混んでくる 'と音質を多少犠 [0063] 牲にしてでも 4800 ビッ ト/秒を使う方が回線の利用効率 [0064] が上がる。 また音声情報を半導体メ モ リ等の記憶装置に [0065] 記憶-させる場合には、 音質を優先するか、 記憶容量を優 [0066] 先するかによつ て使用する情報量が違つ て く.る。 [0067] 従来の音声合成装置は処理できる単位時間当 りの情報 [0068] 量が固定されており、 異なった情報量で表わされた音声 [0069] 情報を処理することができない。 例えば 9600 ビッ ト /秒 [0070] の情報量を扱う音声合成装置では 4800 ッ、、ト Z秒の情報 [0071] 量で表わされる音声情報を処理することができない。 従 [0072] つて電話回線の混み具合によつて伝送する情報量を変え [0073] るという ことができず、 また記憶装置を用いる場合も音 [0074] 質を優先するか、 音声の容量を優先するか応用先に応じ [0075] 0]·.' Ι [0076] . '·,'·,';:-〇 " て音声合成装置を選択しなければならなかった。 [0077] 本発明の目的は単位時間当りの情報量が異なる複数の 方式の音声パラメ ータに基ずいて音声を合成することが できる音声合成装置を得るものである。 [0078] 発 明 の 開 示 [0079] 本発明は、 自然音声よ り一定時間間隔ごとに波形を切 り出し、 切り出されたそれぞれの波形から抽出された [0080] 個の偏自己相関係数をもとに一定時間間隔でフィルタ を 変化させて音声を合成し出力する音声合成装置において、 1 時間間隔内に配分される 個の偏自己相関係数を含む 音声パラ メ ータの量子化ビッ トを変えずに、 偏自己相関 係数を抽出する際の波形の切り 出し間隔と合成の際の合 成間隔を同時に可変することによつて単位時間あたりの 合成のために使用する情報量を可変し、 単位時間当り-の 情報量が異なる複数の方式の音声パラメ—タに基ずいて、 [0081] -..それぞれの音声を合成できるよ うにしたものである。 [0082] '図面の簡単な説明 [0083] 第 1 図は本発明の音声合成装置の一実施例を示すブ口 ック図、 [0084] 第 2 図は音声パラ メ ータ の入力タイ ミ ングを示すタイ ム線図、 [0085] 第 5図は本発明の音声合成装置の入力同期信号を発生 するカ ウ ンタの一実施例を示すプロ ック図である。 [0086] 発明を実施するための最良の形態 [0087] 第 1 図は本発明の音声合成装置の一実施例を示すブロ [0088] 0:: 1 ック図で、 1 は音声パラメ 一タが記憶される記憶装置、 [0089] 2は記憶装置 1 から出力すべき音声パラメ ータのァ' ド レ [0090] スを指定し、 音声合成の開始及び終了、 音声パラメ 一タ [0091] の転送レー トの指定等を行なう制御装置である。 記憶装 [0092] 置 1 は例えば半導体メ モ リ で構成され、 これに記憶され [0093] る音声パラメ ータは音声の振幅を表わす振幅情報、 声帯 の基本振動周波数に相当するピッチ情報、 10個の偏自己 [0094] 相関係数が記憶される。'記憶装置 1 に記憶される情報は [0095] 1 フ レーム当り振幅情報 7 .ビッ ト、 ピッチ情報 7 ビッ ト、 [0096] 10個の偏自己相関係数が 82ビッ ト合計 90ビッ トの情報量 [0097] で記億されている。 制御装置 2は例えばマイ ク ロ コ ン ビ [0098] ュ —タで構成され、 '會己憶装置 1 に記億されている音声パ [0099] ラメータを記憶装置 1 から順次出力させるために、 出力 [0100] ' すべき音声パラメ ータのア ド レ ス指定、 音声合成の開始 [0101] 及び終了等の制御信号を出力し、 この制御信号は記憶装 [0102] 量 1 供給される。 記憶装置 1 は制御装置 2の制御信号 [0103] に従つ て記憶された音声パラメ ータを振幅 , ピッ チ , 偏 [0104] 自己相関係数の順にシ リ アルに読み出し、 これをイ ンタ [0105] フユ ー ス論理部 5 へ供給する。 イ ンタフユ ース論理部 3 [0106] は制御装置 2から出力される制御指令信号を受信し、 こ [0107] の制洶指令信号に従つて記憶装置 1 か <洪裣される音声 [0108] パラメ 一タから振幅情報, ピツチ情報, 偏自己相関係数 [0109] を分 ¾ し、 ピ ッチ情報から有声音か無声音かを判別して [0110] 有声音の場合にはパルス発生器を駆動し、 無声音の場合 [0111] には籍音発生器を駆動する。 そしてさらに有声音の場合 [0112] 0:'/ΓΡΙ一 にはピッチ惰報に基ずいてパルス発生器のパルス の周期 を変える。 イ ンタ フ ース論理部 3はさらに振幅情報に 基ずいてパルス発生器あるいは雑音発生器の出力信号の 振幅を制御し、 これを音源信号として偏自己相関係数と 共にデジタルフィルタ 4 に供給する。 デジタルフ ィ ルタ 4 は 1 0段の格子型フィルタで構成され、 1 個の格子型フ ィ ル タは 2個の乗算器と , 1 個の減算器, 1個の加算器, 1 個の遅延回路及び 1 個の損失回路を備えている。 そし てイ ンタフ- ース論理部 3から供給された "1 0個の倡自己 相関係、数はデジタルフィ ルタ 4の 1 0段の格子型フィ ルタ にそれぞれ供給され、 デジタルフィルタ 4 で音源信号と 偏自己相関係数が乗算され、 デジタル音声符号が合成さ れる.。 デジタルフィルタ 4 で合成されたデジタル音声持 号はデジタルアナログ変換器 5に供給され、 デジタルァ ナログ変換器 5でデジタル音声符号はアナ口グ信号に変 -換される。 そしてこのアナログ信号はスピーカ όに供給 されて再生される。 [0113] 記憶装置 1 に記憶される音声パ 7 メ ータは 1 フ レーム 当り 90ビッ ト で構成され、 1 フ レームの時間は 2 Om e c に選ばれている。 従って. 1 秒間の音声を合成する場合、 イ ンタ フユ 一ス論理部 3 は 480 0 ビッ トの情燕を転送する。 合成音の質を向上させるためには単位時間当りの情報量 を多くすればよ く、 1 フ レーム当りの情報量 96ビッ トは 変えずに 1 フ レームの時間を 1 O TTi e c に選ぶと、 1 秒当 り 90 00 ビッ トの情報量となり合成音の質を向上させるこ とができる。 即ち 1 フ レーム当りのビッ ト数を変えずに フ レーム周期を変えるだけで、 単位時間当 りの音声パラ メ一タの転送量を変えることができる。 [0114] 第 2図は第 1 図に示す音声合成装置の音声パラメ —タ の入力タ イ ミ ングを示すタ イ ムチ ャー トであり、 第 2図 は 1 フ レームを J ec とした場合、 第 2図 J5は 1 フ レームを l OTO ec とした場合である。 いずれも 1 フ レー ム当りの情報量は%ビッ ト であるが、 第 2図 Sに示すよ' うにフ レ ーム周期を にすると 1 秒間に転送する情報 量は 2倍となる。 従って電話回線の混雑の度合、 必要と する合成音の質に応じて音声分析, 音声合成の 1 フ レー ムの時間を 20τπ·$· β にする力、、 10ms ec にする力 還折す ればよい。 また音声合成装置も入力または記憶された音 声パラメ 一タ の フ レーム周期に合せて音声パラメ ータの 取り込み周期が切換えられるよ うにすれば、 9<500ビッ ト 秒-の情報量と '4800 ビッ ト Z秒の情報量を切換えに処理 することができる。 [0115] 記憶装置 1 には 1 フ レーム当り 90 ビッ ト で 1 フ レーム の時間力 2OTO 0c の場合の音声パラメ 一タ と、 1 フ レ ー ム当り 90 ビッ トで 1 フ レ ームの時間が 1 Q s e c の場合の 音声パラメ—タがそれぞれ一緒に記憶さ か、 あるい はいずれか一方の音声パラメ 一タが選択されて記憶され ている。 また電話回籙等を通して他から音声パラメ ータ が耘送されて釆る場合には、 記憶装置 1 にはその時時に 使 ¾される転送量、 即ち 4800 ビッ ト Z秒あるいは 9000 ビッ トノ秒の情報量で表わされた音声パラメ —タが記憶 [0116] される。 [0117] イ ン タ フニ ース論理部 3は記憶装置 1 から供給される [0118] 音声パラメータの単位時間当りの転送量に応じて、 情報 [0119] を取り込むタィ ミ ングを変えなければならない。 イ ン タ [0120] フユ ース論理部 5は記憶装置 1 から音声パラメ 一タを1.2 [0121] ms e c で取り込み、 この取り込み動作は第 2図に示すタ [0122] ィ ムチ ヤ 一トにお、、て 1 フ レームの最後の 2.5OTJ e c の時 [0123] 間のう ちに次のフ レームの音声パラメ 一タを取り込む。 [0124] 従っ て 1 OTO e c ある、、 2 O7n e c ごとに音声 'ラメ 一タ [0125] を取り込むための同期信号を発生する必要がある。 カウ [0126] ンタ部 17は、 このイ ンタ フ - ース論理部 5 が情報を取り [0127] 込むために必要 入力タイ ミ ング信号を発生しており、 [0128] その入カタィ ミ ング信号は力 ゥンタ部 "17の出力端子 "10か [0129] らイ ン タ フエ ース論理部 5 に供給されている。 カ ウ ンタ [0130] --.部 17の出力信号である入力タイ ミ ング信号の周期はスィ [0131] ツチ部12で切換えられ、 音声パラ メ 一タの単位時間当り [0132] の耘送量の違に応じて変化させられる。 スィ ッ チ部12は [0133] 切換スィ ツチ 20を備え、 その可動接点21はカウ ン タ部17 [0134] に接読され、 2個の固定接点22, 23のう ち一方の固定接 [0135] 点22は外部の電源 eeに接銃され、 他方、の, 定接点 25は [0136] カウ ンタ部 7に接続されている。 そして可動接点 2"!を一 [0137] 方の固定接点22に接続するとカウ ンタ部17からは 10"weC ごとに入力タイ ミ ング信号が出力され、 900Q ビッ 卜 Z秒 [0138] の情報量に対処する。 また可動接点21を他方の固定接点 ο:.ί ι . 25に接続するとカウンタ部 17からは 2 o J e c ごとに入力 タィ ミ ング信号が出力され 4S00 ビッ ト Z秒の情報量に対 処する。 [0139] このよ うに音声パラ メ ータのビッ ト配分は全く変化な く、 フ レーム周期を変えることだけで音声パラ メ ータの' 転送量が切換えられたことになる。 音声パラメ 一タが入 力された後の動作は音声パラメ 一タの値とは独立に、 常 に音声合成動作を行なっており、 音声パラ メ ータが入力 されると、 ディ ジタルフ ィ ルタ 4 の入力が新しい値とな り、 次々 とディ ジタル音声符号を合成していく。 ディ ジ タル音声符号はディ ジタルアナ口グ変換器 5によ りアナ ログ音声信号に変換される。 このアナログ信号でスピ一 力を駆動し、 合成音声が出力される。 . [0140] 第 5図は本発明の音声合成装置の力ゥンタ部の一実施 例を示すブロ ック図である。 第 3図において 7は 8段構 [0141] '- -成の-第 1 のバイ ナ リ カウ ンタで例えば 8個のフ リ ッ ブフ [0142] 口 ッブ回路で構成されている。 第 1 のフ リ ップフロ ップ 回路 71の一方の出力端子 はいずれにも接続されず、 他 ' 方の出力端子 Qは第 2のフ リ ップフロ ップ回路 72の入力 端子 に接続され、 さらに第 1 の N D回路 9 と第 2の [0143] V >回路 の入力端子に接続されてい ¾ また第 2 の フ リ ッ プフ ロ ッ プ回路72も同様にその他方の出力端子 Q 力' 第 3 の フ リ ッブフロ ップ回路ァ5の入力端子/ πに接続 され、 さらに第 1 及び第 2 の N Ζ)回路 9 , 1 0のそれぞ れの入力端子に接続されている。 第 3のフ リ ップフ ロ ッ [0144] OMPI ブ回路 75及び第 5 のフ リ ッブフ ロ ッブ回路 75も同様な接 続がなされている。 第 4のフ リ ップフロ ッブ回路74はそ の一方の出力端子 Qが第 1 の 回路 9の入力端子に 接続され、 他方の出力端子 が第 2 の N 回路 10の入 力端子に接続されている。 第 ό のフ リ ッ ブフ 口 ッブ回路 70の一方の出力端子 Qは第 2 の A N D回路 10の入力端子 に接続され、 他方の出力端子 Qは第 1 の N i)回路 9 の 入力端子に接続されている。 また第 7のフ リ ップフロ ッ ブ回路 の一方の出力端子 Qは第 1 及び第 2の 回 路 9 , "10のそれぞれの入力端子に接続され、 さらに第 δ のフ リ ップフロ ッブ回路ァ8の一方の出力端子 Qは第 1 の ^ V i)回路の入力端子に接続され、 他方の出力端子 は 第.2 の 回路 0の入力端牛に接続されている。 第 1 の iV )回路 9の出力端子は第 1 から第 8のフ リ ップフ α ッブ回路 71— 78のそれぞれのリセ ッ ト端子 に接続さ れている。 また第 1 のフ リ ッブフ口 ップ回路71の入力端 子 は第 1 のク α ックパルス発生器 8に接続されている c [0145] 11は 3段構成の第 2のバイナ リカウンタで 5個のフ リ ッブフロ ッブ回路 111一 "M5で構成され、 第 1 段目のフ リ ップフロ ッブ回路 111 の入力端子 は^ f iV D回路 9、の出 力端子に接銃され、 一方の出力端子 Qは'、第 の V 回 路 15の入力铠子に接続され、 他方の出力端子 は第 2段 目のフ リ ップフ ロ ップ回路 1 2の入力端子に接続されて いる。 また第 2段目のフ リ ッ プフ ロ ッ プ回路 "2 も同様 にその一方の出力端子 Qが第 5 の A N D回路の入力端子 に接続され、 他方の出力端子 は第 5段目のフ リ ップフ ロ ッブ回路 113 の人力端子/ に接続されている。 第 5段 目のフ リ ッブフ口 ジ ブ回路 113の一方の出力端子 Qは切 換スィ ツチ 20の他方の固定接点 25に接続さ 'れている。 第 [0146] 1 の A Ν Ζ>回路 9の出力端子はさらに S フ リ ッブフ口 ッ プ回路 のセッ ト入力端子 5に接続され、 フ リ ツ ブフ σ ッブ回路 15のリセッ ト入力端子 は第 2の N D回路 [0147] 10の出力端子に接続されている。 フ リ ップフロ ップ回路 [0148] 15の出力端 ίは第 5の V D回路15の入力端子に接続さ れ、 第 3の ^ N 回路15の他の入力端子はィンタ フ - 一 [0149] ス論理部 3の内部に設けられた第 2のクロ ックパルス発 [0150] 生器 4に接続され、 またフ リ ップフロ ッブ回路15の出力 端子は出力端子 1όに接続されている。 [0151] このような回路において、 まず音声パラメ ータの転送 [0152] 量が 4S00 ビッ ト/秒の場合について説明する。 この場合 [0153] にはスイ ッチ 20の可動接点 21は他方の固定接点 23に接続 されている。 そして第 1 のカウンタ 7はク ロ ックパルス 発生器 8のク ロ ックパルスを順次力ゥン ト し、 200個の ク 口 ックパルスをカウ ン トすると i)回路 9 の入力端 ' 子に接続されている 8個のフ リ ッブフ口 ッブ回路 71— 78 の出力端子は全てハイ レベルとなっ て 1 ^力する。 こ の結杲 »回路 9の出力はハイ レベルとなっ て 1 を出- 力しカウ ンタ 7をリ セ ッ 卜する。 即ち N 回路 9は力 [0154] ゥンタ 7 力 ノ、 'ノレス発生器 8 のク ロ ック パノレスを 200個力 ゥ ン トするごとに 1 出力を出す。 これは時間間隔にして [0155] ΟΜ Ι_ 2.5 mi ec ごとに ^ N )回路 9から 1 出力が出力されるこ [0156] とになる。 第 2のカウ ンタ Mは N »回路 9の出力を力 [0157] ゥ ン ト し、 N D回路 9 の出力を 8個カ ウ ン トすると 5 [0158] 個のフ リ ッブフ口 ッブ 111一 U 5の Q出力端子はハイ レベ ルとなって 1 を出力する。 即ち 2.5 7^ ec ごとに出力され [0159] る N D回路 9 の出力を 8個カウ ン ト して 20r^ec にな [0160] ると第 5 の 回路にハイ レベルの信号を供給する。 [0161] ま†:R S フ リ ッ ブフ 口 ッ ブ回路 のセッ ト入力端子には [0162] D回路 9 の出力信号が供給されており、 フ リ ツ ブフ [0163] ロ ッブ回路15は 回路 9 の出力信号でセ ッ ト状態と [0164] なり、 その出力端子はハイ レベルとなって 1 の出力信号 [0165] を出力する。 また第 5の V D回路15の入力端子にはク [0166] 口 ックパノレス発生器 14のクロ ック パルスが供給されてい [0167] る。 従って第 3の ^ 回路 15の 5個の入力端子が全て [0168] ハイ レベルになる時点は力 ゥンタ 11の第 5段目のフ リ ッ [0169] ブフロ ッブ回路 113の出力端子 Qがハイ レベルとなつた [0170] 時、 即ちカ ウンタ部 17が動作を開始してから 20 ^e e 後 [0171] となる。 カ ウンタ 11 の 5 個のフ リ ッ ブフ ロ ッ ブ 111— 115 [0172] は 8個のパルスをカ ウン トすると リセ ッ トきれて再び 1 [0173] 力 らパルスをカ ウ ン トするため、 第 5の V D回路の全 [0174] ての入力端子がハイ レベルとなるのは 2 a7 e c ごと とな [0175] り、 この時 N D回路 "15出力端子 10からハイ レベル即ち [0176] 1 の出力が出力される。 出力端子 1<Sに現われた信号は第 [0177] 1 図のイ ン タ フ - —ス論理部 3 に供給され、 イ ン タ フ ユ —ス論理部 3は出力端子 1όに 1 出力が現われている期間 [0178] 〇M I <:',, ' に記憶装置 1 から音声パラメ一タを取り込む。 [0179] 第 2 の A N D回路 10の全ての入力端子は、 第 1 のカウ [0180] ン タ 7力 ノ ノレス勞生器 8のク 口 ッ ク ノ ノレスを 9ό個カウ ン [0181] ト した時、 即ちカ ウンタ 7がカウ ン トを開始してから1 -2 [0182] msec 経過した時にハイ レベルとなり、 その出力端子に [0183] 1 の信号を出力する。 そして v i)回路 10のハイ レベル [0184] の出力は S フ リ ップフ 口ッブ回路 13のリセッ ト入力端 [0185] 子 に供給されフ リ ッブフ口 ップ回路15をリセ ッ ト状態 [0186] にする。 従つ てフ リ ップフ 口 ッブ回路 15は N X»回路 9 [0187] の出力でセ ッ ト状態になつてから 1.2mj e c 経過後にリ セ [0188] ッ ト状態になり、 その出力は口 一 レベルの 0出力となる, これによ り ^ V 回路 15の出力は 0 となり、 イ ンタフ- • —ス論理部 5の情報取り込み動作は終了する。 従っ てィ [0189] ンタ フユ 一ス論理部 5 A N D回路 15の出力がハイ レべ [0190] ソレとなって 、る 1.2 1 β e の期曰 3に のノ ソレス信号 [0191] -を 9ό-個取り込み、 これを音声パラメ ータを取り込む同期 [0192] 信号とする。 [0193] 次に音声パラメ 一タの'転送量が 9600 ビッ ト Z秒の場合 [0194] について説明する。 この場合には切換スィ ッ チ 20の可動 [0195] 接点21は一方の固定接点 22に接続される。 固定接点22に [0196] ヽ、 [0197] は電源よ り正電圧が供給されており、 こ )電圧はスイ ツ [0198] チ 20を通して _D回路15の入力端子に供給される。 従 つ て A N D回路 15の全ての入力端子がハイ レベル となる [0199] 時は力ゥ ンタ 11の第 1 及び第 2のフ リ ッブフ口 ッブ 111 , [0200] 112 の出力端子 Qがそれぞれハイ レベルとなって 1 信号 [0201] VII〇 が出力された時となる。 即ち 回路 9の出力信号を [0202] 2. m s e c おきに数えて第 4番目 と第 8番目の期間に Λ [0203] D回路 15の出力端子 に 1 の信号が出力される。 出力端 [0204] 子 1 όがハイ レベルになる時間間隔は 1 0 e e となり、 ィ [0205] ン タ フ ユ 一ス論理部 S は 1 Q m s e c間隔で 1 フ レ ーム当り [0206] 96 ビッ ト の音声パラメ ータを取り込む。 [0207] このよ う に 1 フ レーム分の音声パラメ ータを 90 ビッ ト [0208] にし、 1 フ レームを 20 ミ リ秒とすると 1 秒間の音声を合 [0209] 成するための音声パラメ 一タの転 量は 4800 ビッ ト/秒 [0210] であるが、 この "I フ レームの周期を の 10 ミ リ秒に切 [0211] 換えると 1 フ レームの情報量は同じ 90ビッ ト であつても、 [0212] 1秒間に 9600 ビッ トの音声パラメ 一タを転送することが [0213] できる。 即ち音声パラメ —タのビッ ト配分は'全く変化な [0214] く、 フ レーム周期を変えることだけで音声パラメ ー タ の [0215] 転送量を切換えることができる。 [0216] - 産業上の利用可能性 [0217] 本発明の音声合成装置は電話回線を利用して天気予報 [0218] 等の情報を連続して音声で提供する案内装置、 学習問題 [0219] を音声で出題する学習器等に利用できる。 [0220] c- · Ι ,
权利要求:
Claims 請 求 の 範 囲 自然音声よ り一定時間間隔ごとに波形を切り出し、 切り出されたそれぞれの波形から抽出された 個の偏 自己相関係数をもとに一定時間間隔でフィルタを変化 させて音声を合成し出力する音声合成装置において、 個の偏自己相関係数を含む音声パラメ ータの量子化 ビッ ト配分を変えずに、 偏自己相関係数を抽出する際 の波形の切り出し間隔と合成の際の間隔を同時に可変 することに'よつて単位時間あたりの合成のために使用 する情報量を可変することを特徵とする音声合成装置, 前記合成の時間間隔と音声パラメ ータを取り込む時 間間隔を独立に指定する力ゥ ン タを傭えたことを特徵 とする特許請求の範囲第 1項に記載された音声'合成装
类似技术:
公开号 | 公开日 | 专利标题 US8005555B2|2011-08-23|Audio signal processing apparatus US7119268B2|2006-10-10|Portable telephony apparatus with music tone generator US6678652B2|2004-01-13|Audio signal processing apparatus US4624012A|1986-11-18|Method and apparatus for converting voice characteristics of synthesized speech US5809472A|1998-09-15|Digital audio data transmission system based on the information content of an audio signal CN100349228C|2007-11-14|在存储媒体上记录或者重放的方法和装置 US4020282A|1977-04-26|High density data processing system US6349277B1|2002-02-19|Method and system for analyzing voices CA1127765A|1982-07-13|Speech analyzer comprising circuits forcalculating autocorrelation coefficientsforwardly and backwardly US4916996A|1990-04-17|Musical tone generating apparatus with reduced data storage requirements US4720861A|1988-01-19|Digital speech coding circuit Atal1983|Efficient coding of LPC parameters by temporal decomposition KR100564057B1|2007-03-21|엔코딩시스템및방법,디코딩시스템및방법,엔코딩데이타기록장치및방법과,엔코딩데이타전송장치및방법 KR100472904B1|2005-03-08|음악 부분을 자동으로 선별해 저장하는 디지털 음악 재생장치 및 그 방법 CA1138580A|1982-12-28|Digital intercept recorder/announcer system US4473904A|1984-09-25|Speech information transmission method and system US4121058A|1978-10-17|Voice processor US5245667A|1993-09-14|Method and structure for synchronizing multiple, independently generated digital audio signals US4809271A|1989-02-28|Voice and data multiplexer system CA1181857A|1985-01-29|Silence editing speech processor US5915237A|1999-06-22|Representing speech using MIDI US6839446B2|2005-01-04|Hearing aid with sound replay capability EP0205200A1|1986-12-17|Verfahren zur Übertragung von Audio-Information und Zusatzinformation in digitaler Form US6734351B2|2004-05-11|Apparatus and method for sampling and storing audio information and apparatus for outputting audio information CA1295421C|1992-02-04|Amplitude enhanced sampled clipped speech encoder and decoder
同族专利:
公开号 | 公开日 EP0045813A1|1982-02-17| JPS5913758B2|1984-03-31| EP0045813B1|1985-07-03| JPS56117294A|1981-09-14| EP0045813A4|1982-07-13| US4491958A|1985-01-01|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
1981-09-03| AK| Designated states|Designated state(s): US | 1981-09-03| AL| Designated countries for regional patents|Designated state(s): DE FR GB NL | 1981-09-17| WWE| Wipo information: entry into national phase|Ref document number: 1981900494 Country of ref document: EP | 1982-02-17| WWP| Wipo information: published in national office|Ref document number: 1981900494 Country of ref document: EP | 1985-07-03| WWG| Wipo information: grant in national office|Ref document number: 1981900494 Country of ref document: EP |
优先权:
[返回顶部]
申请号 | 申请日 | 专利标题 JP80/20597||1980-02-22|| JP2059780A|JPS5913758B2|1980-02-22|1980-02-22||DE8181900494T| DE3171171D1|1980-02-22|1981-02-17|Speech synthesis unit| 相关专利
Sulfonates, polymers, resist compositions and patterning process
Washing machine
Washing machine
Device for fixture finishing and tension adjusting of membrane
Structure for Equipping Band in a Plane Cathode Ray Tube
Process for preparation of 7 alpha-carboxyl 9, 11-epoxy steroids and intermediates useful therein an
国家/地区
|